【例子介绍】java解析html工具htmlparser的jar包及api文档
用于解析html的java开源工具,很有用
【相关图片】
【源码结构】
文件清单
├── HTMLParser-2.0-SNAPSHOT
│ └── docs
│ ├── bug.html
│ ├── css
│ │ ├── maven-base.css
│ │ ├── maven-theme.css
│ │ ├── print.css
│ │ └── site.css
│ ├── faq.html
│ ├── images
│ │ ├── collapsed.gif
│ │ ├── expanded.gif
│ │ ├── external.png
│ │ ├── htmlparserlogo.jpg
│ │ ├── icon_error_sml.gif
│ │ ├── icon_info_sml.gif
│ │ ├── icon_success_sml.gif
│ │ ├── icon_warning_sml.gif
│ │ ├── logos
│ │ │ └── maven-feather.png
│ │ └── newwindow.png
│ ├── index.html
│ ├── issue-tracking.html
│ ├── javadoc
│ │ ├── allclasses-frame.html
│ │ ├── allclasses-noframe.html
│ │ ├── constant-values.html
│ │ ├── deprecated-list.html
│ │ ├── doc-files
│ │ │ ├── building.html
│ │ │ ├── overview.html
│ │ │ └── using.html
│ │ ├── help-doc.html
│ │ ├── index-all.html
│ │ ├── index.html
│ │ ├── org
│ │ │ └── htmlparser
│ │ │ ├── Attribute.html
│ │ │ ├── beans
│ │ │ │ ├── BeanyBaby.html
│ │ │ │ ├── class-use
│ │ │ │ │ ├── BeanyBaby.html
│ │ │ │ │ ├── FilterBean.html
│ │ │ │ │ ├── HTMLLinkBean.html
│ │ │ │ │ ├── HTMLTextBean.html
│ │ │ │ │ ├── LinkBean.html
│ │ │ │ │ └── StringBean.html
│ │ │ │ ├── FilterBean.html
│ │ │ │ ├── HTMLLinkBean.html
│ │ │ │ ├── HTMLTextBean.html
│ │ │ │ ├── LinkBean.html
│ │ │ │ ├── package-frame.html
│ │ │ │ ├── package-summary.html
│ │ │ │ ├── package-tree.html
│ │ │ │ ├── package-use.html
│ │ │ │ └── StringBean.html
│ │ │ ├── class-use
│ │ │ │ ├── Attribute.html
│ │ │ │ ├── NodeFactory.html
│ │ │ │ ├── NodeFilter.html
│ │ │ │ ├── Node.html
│ │ │ │ ├── Parser.html
│ │ │ │ ├── PrototypicalNodeFactory.html
│ │ │ │ ├── Remark.html
│ │ │ │ ├── Tag.html
│ │ │ │ └── Text.html
│ │ │ ├── filters
│ │ │ │ ├── AndFilter.html
│ │ │ │ ├── class-use
│ │ │ │ │ ├── AndFilter.html
│ │ │ │ │ ├── CssSelectorNodeFilter.html
│ │ │ │ │ ├── HasAttributeFilter.html
│ │ │ │ │ ├── HasChildFilter.html
│ │ │ │ │ ├── HasParentFilter.html
│ │ │ │ │ ├── HasSiblingFilter.html
│ │ │ │ │ ├── IsEqualFilter.html
│ │ │ │ │ ├── LinkRegexFilter.html
│ │ │ │ │ ├── LinkStringFilter.html
│ │ │ │ │ ├── NodeClassFilter.html
│ │ │ │ │ ├── NotFilter.html
│ │ │ │ │ ├── OrFilter.html
│ │ │ │ │ ├── RegexFilter.html
│ │ │ │ │ ├── StringFilter.html
│ │ │ │ │ └── TagNameFilter.html
│ │ │ │ ├── CssSelectorNodeFilter.html
│ │ │ │ ├── HasAttributeFilter.html
│ │ │ │ ├── HasChildFilter.html
│ │ │ │ ├── HasParentFilter.html
│ │ │ │ ├── HasSiblingFilter.html
│ │ │ │ ├── IsEqualFilter.html
│ │ │ │ ├── LinkRegexFilter.html
│ │ │ │ ├── LinkStringFilter.html
│ │ │ │ ├── NodeClassFilter.html
│ │ │ │ ├── NotFilter.html
│ │ │ │ ├── OrFilter.html
│ │ │ │ ├── package-frame.html
│ │ │ │ ├── package-summary.html
│ │ │ │ ├── package-tree.html
│ │ │ │ ├── package-use.html
│ │ │ │ ├── RegexFilter.html
│ │ │ │ ├── StringFilter.html
│ │ │ │ └── TagNameFilter.html
│ │ │ ├── http
│ │ │ │ ├── class-use
│ │ │ │ │ ├── ConnectionManager.html
│ │ │ │ │ ├── ConnectionMonitor.html
│ │ │ │ │ ├── Cookie.html
│ │ │ │ │ └── HttpHeader.html
│ │ │ │ ├── ConnectionManager.html
│ │ │ │ ├── ConnectionMonitor.html
│ │ │ │ ├── Cookie.html
│ │ │ │ ├── HttpHeader.html
│ │ │ │ ├── package-frame.html
│ │ │ │ ├── package-summary.html
│ │ │ │ ├── package-tree.html
│ │ │ │ └── package-use.html
│ │ │ ├── lexer
│ │ │ │ ├── class-use
│ │ │ │ │ ├── Cursor.html
│ │ │ │ │ ├── InputStreamSource.html
│ │ │ │ │ ├── Lexer.html
│ │ │ │ │ ├── PageAttribute.html
│ │ │ │ │ ├── Page.html
│ │ │ │ │ ├── PageIndex.html
│ │ │ │ │ ├── Source.html
│ │ │ │ │ ├── Stream.html
│ │ │ │ │ └── StringSource.html
│ │ │ │ ├── Cursor.html
│ │ │ │ ├── InputStreamSource.html
│ │ │ │ ├── Lexer.html
│ │ │ │ ├── package-frame.html
│ │ │ │ ├── package-summary.html
│ │ │ │ ├── package-tree.html
│ │ │ │ ├── package-use.html
│ │ │ │ ├── PageAttribute.html
│ │ │ │ ├── Page.html
│ │ │ │ ├── PageIndex.html
│ │ │ │ ├── Source.html
│ │ │ │ ├── Stream.html
│ │ │ │ └── StringSource.html
│ │ │ ├── lexerapplications
│ │ │ │ └── thumbelina
│ │ │ │ ├── class-use
│ │ │ │ │ ├── Picture.html
│ │ │ │ │ ├── PictureListener.html
│ │ │ │ │ ├── PicturePanel.html
│ │ │ │ │ ├── Sequencer.html
│ │ │ │ │ ├── ThumbelinaFrame.html
│ │ │ │ │ ├── Thumbelina.html
│ │ │ │ │ ├── Tile.html
│ │ │ │ │ └── TileSet.html
│ │ │ │ ├── package-frame.html
│ │ │ │ ├── package-summary.html
│ │ │ │ ├── package-tree.html
│ │ │ │ ├── package-use.html
│ │ │ │ ├── Picture.html
│ │ │ │ ├── PictureListener.html
│ │ │ │ ├── PicturePanel.html
│ │ │ │ ├── Sequencer.html
│ │ │ │ ├── ThumbelinaFrame.html
│ │ │ │ ├── Thumbelina.html
│ │ │ │ ├── Tile.html
│ │ │ │ └── TileSet.html
│ │ │ ├── NodeFactory.html
│ │ │ ├── NodeFilter.html
│ │ │ ├── Node.html
│ │ │ ├── nodes
│ │ │ │ ├── AbstractNode.html
│ │ │ │ ├── class-use
│ │ │ │ │ ├── AbstractNode.html
│ │ │ │ │ ├── RemarkNode.html
│ │ │ │ │ ├── TagNode.html
│ │ │ │ │ └── TextNode.html
│ │ │ │ ├── package-frame.html
│ │ │ │ ├── package-summary.html
│ │ │ │ ├── package-tree.html
│ │ │ │ ├── package-use.html
│ │ │ │ ├── RemarkNode.html
│ │ │ │ ├── TagNode.html
│ │ │ │ └── TextNode.html
│ │ │ ├── package-frame.html
│ │ │ ├── package-summary.html
│ │ │ ├── package-tree.html
│ │ │ ├── package-use.html
│ │ │ ├── parserapplications
│ │ │ │ ├── class-use
│ │ │ │ │ ├── SiteCapturer.html
│ │ │ │ │ └── WikiCapturer.html
│ │ │ │ ├── filterbuilder
│ │ │ │ │ ├── class-use
│ │ │ │ │ │ ├── FilterBuilder.html
│ │ │ │ │ │ ├── Filter.html
│ │ │ │ │ │ ├── HtmlTreeCellRenderer.html
│ │ │ │ │ │ ├── HtmlTreeModel.html
│ │ │ │ │ │ └── SubFilterList.html
│ │ │ │ │ ├── FilterBuilder.html
│ │ │ │ │ ├── Filter.html
│ │ │ │ │ ├── HtmlTreeCellRenderer.html
│ │ │ │ │ ├── HtmlTreeModel.html
│ │ │ │ │ ├── layouts
│ │ │ │ │ │ ├── class-use
│ │ │ │ │ │ │ ├── NullLayoutManager.html
│ │ │ │ │ │ │ └── VerticalLayoutManager.html
│ │ │ │ │ │ ├── NullLayoutManager.html
│ │ │ │ │ │ ├── package-frame.html
│ │ │ │ │ │ ├── package-summary.html
│ │ │ │ │ │ ├── package-tree.html
│ │ │ │ │ │ ├── package-use.html
│ │ │ │ │ │ └── VerticalLayoutManager.html
│ │ │ │ │ ├── package-frame.html
│ │ │ │ │ ├── package-summary.html
│ │ │ │ │ ├── package-tree.html
│ │ │ │ │ ├── package-use.html
│ │ │ │ │ ├── SubFilterList.html
│ │ │ │ │ └── wrappers
│ │ │ │ │ ├── AndFilterWrapper.html
│ │ │ │ │ ├── class-use
│ │ │ │ │ │ ├── AndFilterWrapper.html
│ │ │ │ │ │ ├── HasAttributeFilterWrapper.html
│ │ │ │ │ │ ├── HasChildFilterWrapper.html
│ │ │ │ │ │ ├── HasParentFilterWrapper.html
│ │ │ │ │ │ ├── HasSiblingFilterWrapper.html
│ │ │ │ │ │ ├── NodeClassFilterWrapper.html
│ │ │ │ │ │ ├── NotFilterWrapper.html
│ │ │ │ │ │ ├── OrFilterWrapper.html
│ │ │ │ │ │ ├── RegexFilterWrapper.html
│ │ │ │ │ │ ├── StringFilterWrapper.html
│ │ │ │ │ │ └── TagNameFilterWrapper.html
│ │ │ │ │ ├── HasAttributeFilterWrapper.html
│ │ │ │ │ ├── HasChildFilterWrapper.html
│ │ │ │ │ ├── HasParentFilterWrapper.html
│ │ │ │ │ ├── HasSiblingFilterWrapper.html
│ │ │ │ │ ├── NodeClassFilterWrapper.html
│ │ │ │ │ ├── NotFilterWrapper.html
│ │ │ │ │ ├── OrFilterWrapper.html
│ │ │ │ │ ├── package-frame.html
│ │ │ │ │ ├── package-summary.html
│ │ │ │ │ ├── package-tree.html
│ │ │ │ │ ├── package-use.html
│ │ │ │ │ ├── RegexFilterWrapper.html
│ │ │ │ │ ├── StringFilterWrapper.html
│ │ │ │ │ └── TagNameFilterWrapper.html
│ │ │ │ ├── package-frame.html
│ │ │ │ ├── package-summary.html
│ │ │ │ ├── package-tree.html
│ │ │ │ ├── package-use.html
│ │ │ │ ├── SiteCapturer.html
│ │ │ │ └── WikiCapturer.html
│ │ │ ├── Parser.html
│ │ │ ├── PrototypicalNodeFactory.html
│ │ │ ├── Remark.html
│ │ │ ├── sax
│ │ │ │ ├── Attributes.html
│ │ │ │ ├── class-use
│ │ │ │ │ ├── Attributes.html
│ │ │ │ │ ├── Feedback.html
│ │ │ │ │ ├── Locator.html
│ │ │ │ │ └── XMLReader.html
│ │ │ │ ├── Feedback.html
│ │ │ │ ├── Locator.html
│ │ │ │ ├── package-frame.html
│ │ │ │ ├── package-summary.html
│ │ │ │ ├── package-tree.html
│ │ │ │ ├── package-use.html
│ │ │ │ └── XMLReader.html
│ │ │ ├── scanners
│ │ │ │ ├── class-use
│ │ │ │ │ ├── CompositeTagScanner.html
│ │ │ │ │ ├── JspScanner.html
│ │ │ │ │ ├── Scanner.html
│ │ │ │ │ ├── ScriptDecoder.html
│ │ │ │ │ ├── ScriptScanner.html
│ │ │ │ │ ├── StyleScanner.html
│ │ │ │ │ └── TagScanner.html
│ │ │ │ ├── CompositeTagScanner.html
│ │ │ │ ├── JspScanner.html
│ │ │ │ ├── package-frame.html
│ │ │ │ ├── package-summary.html
│ │ │ │ ├── package-tree.html
│ │ │ │ ├── package-use.html
│ │ │ │ ├── Scanner.html
│ │ │ │ ├── ScriptDecoder.html
│ │ │ │ ├── ScriptScanner.html
│ │ │ │ ├── StyleScanner.html
│ │ │ │ └── TagScanner.html
│ │ │ ├── Tag.html
│ │ │ ├── tags
│ │ │ │ ├── AppletTag.html
│ │ │ │ ├── BaseHrefTag.html
│ │ │ │ ├── BodyTag.html
│ │ │ │ ├── Bullet.html
│ │ │ │ ├── BulletList.html
│ │ │ │ ├── class-use
│ │ │ │ │ ├── AppletTag.html
│ │ │ │ │ ├── BaseHrefTag.html
│ │ │ │ │ ├── BodyTag.html
│ │ │ │ │ ├── Bullet.html
│ │ │ │ │ ├── BulletList.html
│ │ │ │ │ ├── CompositeTag.html
│ │ │ │ │ ├── DefinitionListBullet.html
│ │ │ │ │ ├── DefinitionList.html
│ │ │ │ │ ├── Div.html
│ │ │ │ │ ├── DoctypeTag.html
│ │ │ │ │ ├── FormTag.html
│ │ │ │ │ ├── FrameSetTag.html
│ │ │ │ │ ├── FrameTag.html
│ │ │ │ │ ├── HeadingTag.html
│ │ │ │ │ ├── HeadTag.html
│ │ │ │ │ ├── Html.html
│ │ │ │ │ ├── ImageTag.html
│ │ │ │ │ ├── InputTag.html
│ │ │ │ │ ├── JspTag.html
│ │ │ │ │ ├── LabelTag.html
│ │ │ │ │ ├── LinkTag.html
│ │ │ │ │ ├── MetaTag.html
│ │ │ │ │ ├── ObjectTag.html
│ │ │ │ │ ├── OptionTag.html
│ │ │ │ │ ├── ParagraphTag.html
│ │ │ │ │ ├── ProcessingInstructionTag.html
│ │ │ │ │ ├── ScriptTag.html
│ │ │ │ │ ├── SelectTag.html
│ │ │ │ │ ├── Span.html
│ │ │ │ │ ├── StyleTag.html
│ │ │ │ │ ├── TableColumn.html
│ │ │ │ │ ├── TableHeader.html
│ │ │ │ │ ├── TableRow.html
│ │ │ │ │ ├── TableTag.html
│ │ │ │ │ ├── TextareaTag.html
│ │ │ │ │ └── TitleTag.html
│ │ │ │ ├── CompositeTag.html
│ │ │ │ ├── DefinitionListBullet.html
│ │ │ │ ├── DefinitionList.html
│ │ │ │ ├── Div.html
│ │ │ │ ├── DoctypeTag.html
│ │ │ │ ├── FormTag.html
│ │ │ │ ├── FrameSetTag.html
│ │ │ │ ├── FrameTag.html
│ │ │ │ ├── HeadingTag.html
│ │ │ │ ├── HeadTag.html
│ │ │ │ ├── Html.html
│ │ │ │ ├── ImageTag.html
│ │ │ │ ├── InputTag.html
│ │ │ │ ├── JspTag.html
│ │ │ │ ├── LabelTag.html
│ │ │ │ ├── LinkTag.html
│ │ │ │ ├── MetaTag.html
│ │ │ │ ├── ObjectTag.html
│ │ │ │ ├── OptionTag.html
│ │ │ │ ├── package-frame.html
│ │ │ │ ├── package-summary.html
│ │ │ │ ├── package-tree.html
│ │ │ │ ├── package-use.html
│ │ │ │ ├── ParagraphTag.html
│ │ │ │ ├── ProcessingInstructionTag.html
│ │ │ │ ├── ScriptTag.html
│ │ │ │ ├── SelectTag.html
│ │ │ │ ├── Span.html
│ │ │ │ ├── StyleTag.html
│ │ │ │ ├── TableColumn.html
│ │ │ │ ├── TableHeader.html
│ │ │ │ ├── TableRow.html
│ │ │ │ ├── TableTag.html
│ │ │ │ ├── TextareaTag.html
│ │ │ │ └── TitleTag.html
│ │ │ ├── Text.html
│ │ │ ├── util
│ │ │ │ ├── ChainedException.html
│ │ │ │ ├── CharacterReference.html
│ │ │ │ ├── class-use
│ │ │ │ │ ├── ChainedException.html
│ │ │ │ │ ├── CharacterReference.html
│ │ │ │ │ ├── DefaultParserFeedback.html
│ │ │ │ │ ├── EncodingChangeException.html
│ │ │ │ │ ├── FeedbackManager.html
│ │ │ │ │ ├── IteratorImpl.html
│ │ │ │ │ ├── NodeIterator.html
│ │ │ │ │ ├── NodeList.html
│ │ │ │ │ ├── NodeTreeWalker.html
│ │ │ │ │ ├── ParserException.html
│ │ │ │ │ ├── ParserFeedback.html
│ │ │ │ │ ├── ParserUtils.html
│ │ │ │ │ ├── SimpleNodeIterator.html
│ │ │ │ │ └── Translate.html
│ │ │ │ ├── DefaultParserFeedback.html
│ │ │ │ ├── EncodingChangeException.html
│ │ │ │ ├── FeedbackManager.html
│ │ │ │ ├── IteratorImpl.html
│ │ │ │ ├── NodeIterator.html
│ │ │ │ ├── NodeList.html
│ │ │ │ ├── NodeTreeWalker.html
│ │ │ │ ├── package-frame.html
│ │ │ │ ├── package-summary.html
│ │ │ │ ├── package-tree.html
│ │ │ │ ├── package-use.html
│ │ │ │ ├── ParserException.html
│ │ │ │ ├── ParserFeedback.html
│ │ │ │ ├── ParserUtils.html
│ │ │ │ ├── SimpleNodeIterator.html
│ │ │ │ ├── sort
│ │ │ │ │ ├── class-use
│ │ │ │ │ │ ├── Ordered.html
│ │ │ │ │ │ ├── Sortable.html
│ │ │ │ │ │ └── Sort.html
│ │ │ │ │ ├── Ordered.html
│ │ │ │ │ ├── package-frame.html
│ │ │ │ │ ├── package-summary.html
│ │ │ │ │ ├── package-tree.html
│ │ │ │ │ ├── package-use.html
│ │ │ │ │ ├── Sortable.html
│ │ │ │ │ └── Sort.html
│ │ │ │ └── Translate.html
│ │ │ └── visitors
│ │ │ ├── class-use
│ │ │ │ ├── HtmlPage.html
│ │ │ │ ├── LinkFindingVisitor.html
│ │ │ │ ├── NodeVisitor.html
│ │ │ │ ├── ObjectFindingVisitor.html
│ │ │ │ ├── StringFindingVisitor.html
│ │ │ │ ├── TagFindingVisitor.html
│ │ │ │ ├── TextExtractingVisitor.html
│ │ │ │ └── UrlModifyingVisitor.html
│ │ │ ├── HtmlPage.html
│ │ │ ├── LinkFindingVisitor.html
│ │ │ ├── NodeVisitor.html
│ │ │ ├── ObjectFindingVisitor.html
│ │ │ ├── package-frame.html
│ │ │ ├── package-summary.html
│ │ │ ├── package-tree.html
│ │ │ ├── package-use.html
│ │ │ ├── StringFindingVisitor.html
│ │ │ ├── TagFindingVisitor.html
│ │ │ ├── TextExtractingVisitor.html
│ │ │ └── UrlModifyingVisitor.html
│ │ ├── overview-frame.html
│ │ ├── overview-summary.html
│ │ ├── overview-tree.html
│ │ ├── package-list
│ │ ├── resources
│ │ │ └── inherit.gif
│ │ ├── serialized-form.html
│ │ └── stylesheet.css
│ ├── joinus.html
│ ├── license.html
│ ├── mailinglists.html
│ ├── mail-lists.html
│ ├── project-info.html
│ ├── samples.html
│ ├── source-repository.html
│ ├── support.html
│ ├── team-list.html
│ └── todo.html
└── HTMLParser-2.0-SNAPSHOT-bin
└── HTMLParser-2.0-SNAPSHOT
├── bin
│ ├── beanybaby
│ ├── beanybaby.cmd
│ ├── filterbuilder
│ ├── filterbuilder.cmd
│ ├── lexer
│ ├── lexer.cmd
│ ├── parser
│ ├── parser.cmd
│ ├── sitecapturer
│ ├── sitecapturer.cmd
│ ├── thumbelina
│ ├── thumbelina.cmd
│ ├── translate
│ └── translate.cmd
├── lib
│ ├── filterbuilder.jar
│ ├── htmllexer.jar
│ ├── htmlparser.jar
│ ├── sitecapturer.jar
│ └── thumbelina.jar
├── license.txt
└── readme.html
48 directories, 428 files
评论